文档分类相关论文
随着Internet应用的逐渐普及,WWW已经发展成为一个巨大的分布式信息空间,为用户提供了一个极具价值的信息源。但因Internet所固有的......
随着Internet的普及和快速发展,Internet为我们提供了涉及方方面面的无数的文档资料。因此为了能够在如此巨大并且更新频繁的信息......
当前,随着Internet技术的推广和应用,国际互联网已经成为世界上最大的信息资源库和全球范围内传播信息的最主要的渠道.如何帮助用......
随着人类社会步入信息社会,人类面临“信息爆炸”、“混沌信息空间”和“数据过剩”带来的巨大压力。人们迫切需要一种智能代理完成......
本文对文档分类和聚类方法及其在信息检索中的应用进行了深入研究,主要包括以下几个方面的内容:通过对当前分类方法的分析,提出了......
随着网络技术的迅猛发展,许多公司都企图借此以更贴近用户的服务提高各自的竞争力。用户到底偏好什么成了他们重点关注的问题。人......
XML文档分类技术在XML数据管理中具有重要的学术意义和应用价值。如何对XML数据实现基于语义信息和结构信息的快速分类学习是当前......
随着信息技术的发展,信息化已成为当今世界经济、社会和科技发展的大趋势。作为今后的发展方向和战略重点,军队也在积极推进以信息......
随着网络技术的飞速发展,信息大量膨胀和聚集,互联网已经形成了一个由数据构成的巨大数据仓库,XML(eXtensible Markup Language)作......
随着互联网上信息的爆炸式增长,通用的搜索引擎很难满足特定用户“专、精、深”的查询需求,在此情况下垂直搜索引擎应运而生。本文......
从1993年中国连入Internet我国的信息化越来越快。Internet的快速发展使它成为人们获取信息的必备工具。但是随着信息化的发展Inte......
电子病历作为互联网医疗的基础技术,记录了病人的临床诊疗记录,是极具价值的数据资源。我国市级以上医院的病历信息系统的总数据规......
船舶制造业是传统的重型制造业,面对日益激烈的市场竞争和日韩两国信息化造船技术的广泛应用,我国船舶企业必须不断提高响应能力、创......
现在越来越多的企事业单位和政府部门均建立了自己的Intranet,局域网上的信息管理越来越成为各单位领 导和信息安全管理人员的课题......
根据自适应谐振理论提出了半监督学习自适应谐振理论系统.在该系统中取消了一般半监督学习算法中假定已知数据概率分布的条件限制,......
针对文档水平情感分析传统模型存在先验知识依赖以及语义理解不足问题,提出一种基于注意力机制与层次网络特征表示的情感分析模型T......
本文介绍基于主观Bayes方法的渐进式中文文档分类.包括三个方面:一是应用主观Bayes方法,利用领域专家的经验,减少复杂的计算量.二......
文档的特征提取和文档的向量表示是文档分类中的关键,本文针对这两个关键点提出一种基于word2vec的文档分类方法.该方法根据DF采集......
为了快速准确地对文档进行分类,提出了一种基于局部鉴别嵌入LDE和简化SVM的高效文档分类算法。该算法首先利用LDE算法把高维文档数......
图模型是文本分类中一种比较新的方法,它可以很好地表达词与词之间的关联信息,弥补了传统的以向量空间为基础的文本分类方法的不足......
自动文档分类是信息处理技术的一个重要部分.本文介绍了分类的模型、相似度的计算方法以及分类算法.在分析比较的基础上,选择合适......
多示例学习已应用于许多场景,如图像分类、恶意软件分类、文档分类、对象检测等。在多示例学习中,训练数据集中的每个数据都是一个......
讨论了基于本体的文档自动分类系统的意义,给出了系统的框架。利用现有的文档自动分类技术,结合领域本体的分类词汇为文档建立索引......
An algorithm of text classification is given that imitates human's in this paper. On one hand, the algorithmenhances......
基于流形正则化框架提出一种分类算法(MLD-RLSC),以解决高维文档分类问题。该算法通过构建训练样本的最近邻图来估计数据空间的几何结......
探讨了Web挖掘的相关理论,包括Web文本信息的表示及特征提取,关联规则分析和信息分类综合Web挖掘的关键技术,提出了一个基于Web挖......
该文论述了依托信息传输平台,实现文档分类管理的必要性。文档管理模块提供了强大的检索功能,通过文档管理器,实现了文档的分类管理,使......
多标记学习主要用于解决因单个样本对应多个概念标记而带来的歧义性问题,而半监督多标记学习是近年来多标记学习任务中的一个新的......
支持向量机(SVM)方法通过核函数进行空间映射并构造最优分类超平面解决分类器的构造问题,该方法在文本自动分类应用中具有明显优势.X......
【摘要】隨着信息技术的不断快速发展,档案管理中所涉及到的信息也是越来越多,而这就需要开发一种较为先进的方式,保障档案管理及使用......
统一的文档分类与编码体系是计算机辅助工程建设的基础.为此首先从工程管理的角度出发,建立工程项目的统一的文档分类,然后设计其......
在Web文档信息检索中,文档分类、文档过滤的质量一直是影响用户查询结果的关键。这篇论文将通过分析一些典型的权重函数的构造,提出......
针对WEB文档分类中KNN算法计算复杂度高的缺点,不同于以往从减少训练样本集大小和采用快速算法角度来降低KNN算法的计算复杂度,从并......
文档分类是自然语言处理(NLP)领域中的一个基本问题。近年来,尽管针对这一问题的层级注意力网络已经取得了进展,但由于每条句子被......
文本挖掘是信息挖掘的一个研究分支,用于基于文本信息的知识发现.文本挖掘主要处理半结构化、无结构化和字符型数据.首先介绍了文......
文档分类中,经典的VSM存在着两方面的缺陷:语义问题的忽略和"假相关"问题的显露.本文利用自然语言语义分析的手段和文档外延匹配的......
PLSA和LDA主题模型主要是研究纯文本内容。最近,开始提出用主题模型处理超文本,所提出的超文本模型是生成模型,引出了词和超链接的......
针对文档分类过程中不同大小文档表示、文档特征选择和文档特征编码问题,提出了一种基于粗糙集的角分类神经网络Rough—CC4.利用近义......
分析了文本学习技术在全文检索系统中的作用,指出文本学习机制的优劣从基础上决定了全文检索系统的性能;从训练文本集的标准化表示......
采用了内容过滤和协同过滤相结合的混合过滤模式,利用高级语义知识进行Web文档的主题归类,并引入了典型推荐的思想把用户进行归类......
为了高效地解决Web文档分类问题,提出了一种基于核鉴别分析方法KDA和SVM的文档分类算法。该算法首先利用KDA对训练集中的高维Web文......
许多自然语言应用需要将输入的文本表示成一个固定长度的向量,现有的技术如词嵌入(Word Embeddings)和文档表示(Document Representat......
【正】传统的文档服务模式是以纸质文件为基础,通过人工检索、复制盖章以及控制分发等方式提供文档利用,服务质量与用户体验往往取......
改进了传统的VSM文档分类方法,提出了一种改进的基于VSM的文档快速分类方法。它考虑了禁用词的排除、近义词和同义词的合并以及特征......
针对传统向量空间模型中的特征项孤立处理问题,首先通过χ2统计和特征聚类相结合的模式实现特征降维,然后使用图模型来建立词和词......
面对Internet上不断增长的巨大信息量,如何使用户获得有趣的和有用的信息已成为信息检索急需解决的问题.由于Web文档往往具有不确......
为在每个文档类别中选择更多的特征,解决至少一个特征法(ALOF)的特征不足问题,提出文档特征最大值法(MFT)和改进的文档特征最大值法(IMF......